Interacción entre variables

Relaciónes condicionales

Author

https://dacarras.github.io/

Modified

August 7, 2024

Introdución

Cuando estudiamos las relaciones de covariables con respecto a una variable de respuesta existe un escenario particular, donde las relaciones pueden no ser constantes. Es decir, que la relación de de una covariable con respecto a la variable de respuesta, puede aumentar, o disminuir con respecto a una tercera variable.

En edcuación, existen diversas aplicaciones, donde este escenario es de interés:

    1. podemos estar interesados en buscar factores protectores para la brecha socioeconómica de los resultados académicos de los estudiantes.
    1. podemos estar evaluando el efecto de un programa de intervención, y tener dudas razonables respecto a si el programa es efectivo para todos los estudiantes.
    1. podemos estar estudiando cómo funciona una práctica escolar, y podríamos querer saber si opera de forma compensatoria con respecto a los estudiantes más vulnerables.
    1. podemos estar estudiando cómo funciona una práctica escolar, y podríamos querer evaluar si es igual de beneficiosa para estudiantes hombres y mujeres.
    1. podríamos estar interesados en si la introducción de incentivos salariales para profesores en escuelas vulnerables fomenta la retencion en estas escuelas de modo que se asemejen más al promedio.

En todos los ejemplos anteriores podemos separar nuestras expectativas de resultados en al menos dos elementos:

    1. tenemos una relacion principal entre dos variables (la variable de respuesta, y una covariable)
    1. queremos ver si esta relación principal cambia segun un tercer factor

Una herramienta que nos sirve para estudiar si la relación entre dos variable cambia en relación a un tercer factor son las interacciones entre variables. Esta herramienta nos permite evaluar si una relación de interés entre dos variables, es constante o no, a los valores de una tercera variable. Este tipo de modelos es muy común en el estudio de efectividad escolar, en el estudio de evaluación de programas, y en el estudio general de inequidad escolar.

Idea general

Los modelos de regresión los podemos pensar como modelos de medias condicionadas. En terminos graficos, nos tenemos que imaginar que tenemos una media y condicional a los valores de otros atributos la media de la variable de respuesta puede tomar diferentes posiciones.

Supongamos que tenemos los puntajes de un test que expresa habilidad matemática (e.g., capacidad de resolución de problemas), y denominemos a este puntaje como \(y_{i}\). Que un modelo de regresión sea pensado como un modelo de medias condicionadas, nos permite indicar que podemos expresar diferentes puntos de del puntaje total anterior, segun los valores de otras covariables (i.e., condicional a…). Por ejemplo, que contamos con la escolaridad de los padres de los estudiantes, para los cuales tenemos los puntajes de habilidad. Empleemos a la variable \(x_{i}\) para alojar a los valores de escolaridad de los padres (e.g., 1 para educación terciaria, y 0 para grados educativos menores a la educación terciaria.).

Descriptivamente, podemos calcular las medias de ambos grupos de estudiantes, y ademas, podríamos calcular la diferencia de medias entre ambos grupos, y con lo anterior tener una noción de si los estudiantes difieren en sus puntajes condicional a la escolaridad de sus padres.

Ahora, podemos abordar la misma inquietud empleando un modelo de regresión:

\[y_{i} = \beta_{0} + \beta_{1}x_{i} + \epsilon_{i}\]

Donde,

  • \(y_{i}\) = puntaje total de cada estudiante \(_{i}\).

  • \(x_{i}\) = escolaridad máxima de los padres de cada estudiante \(_{i}\).

Con los resultados de la regresión anterior podemos obtener las medias esperadas de cada grupo:

  • Media de estudiantes con padres de escolaridad menor a terciaria

\(\beta_{0} + \beta_{1}(x_{i} = 0)\)

  • Media de estudiantes con padres de escolaridad terciaria

\(\beta_{0} + \beta_{1}(x_{i} = 1)\)

¿Que pasaría sin incluimos una tercera variable? Si tuvieramos la información de una tercera variable, dado que estamos pensando el modelo de regresión como una forma de expresar medias condicionadas, es que entonces podriamos tener otra diferencia adicional entre grupos. Pensemos en una tercera covariable, como la dependencia de la escuelas (e.g., Privadas y Públicas). Para efectos del ejemplo, pensemos que las escuelas privadas toman un valor uno, y las escuelas públicas toman un valor cero.

\[y_{i} = \beta_{0} + \beta_{1}x_{i} + \beta_{2}w_{i} + \epsilon_{i}\]

  • \(w_{i}\) = tipo de escuela a la que asisten a los estudiantes \(_{i}\), donde 1 son escuelas privadas, y 0 son escuelas públicas.

Con el modelo anterior, solo podemos representar (i.e., asumir) que las medias entre los grupos aumentan o disminuyen con respecto a al intercepto ( \(\beta_{0}\) ), condicional a los valores de \(x_{i}\) (i.e. la escolaridad máxima de los padres) y condicional a los valores de \(w_{i}\) (i.e., la dependencia administrativa de la escuelas).

Para poder representar que las medias anteriores son condicionales entre sí o que interactúan, necesitamos incluir un término adicional: el multiplo de las variables \(x_{i}\) e \(w_{i}\), es decir \(x_{i}*w_{i}\). Este término nos permitirá obtener un coeficiente de regresión adicional, el cual nos permite saber si hay un “exceso” en las diferencias de medias que estamos obteniendo con los coeficientes anteriores. De esta forma, si incluimos a todos los términos:

\[y_{i} = \beta_{0} + \beta_{1}x_{i} + \beta_{2}w_{i} + \beta_{3}(x_{i}*w_{i})+\epsilon_{i}\]

La inquietud general que uno busca responder con el estudio de interacciones entre variables es si la relación entre variables que tenemos en la expresión anterior es equivalente, cuando consideramos la información de una tercera variable.

Ejemplo sustantivo

Representación Formal

Ecuación

\[y_{i} = \beta_{0} + \beta_{1}x_{i} + \beta_{2}w_{i} + \beta_{3}(x_{i}*w_{i}) + \epsilon_{i}\]

Diagrama Conceptual

Diagrama de vías

Caso aplicado

Introducción

Datos

Preparar Datos

Ajustar Modelo

Tabla de resultados

Descripción de resultados

Tópicos en estudios de interacción

Interacciones entre dicotómicas

Interacciones entre dicotómicas y continuas

Interacciones entre continuas

Inferencia en interacciones

Poder estadístico

Modelos alternativos para evaluar interacciones

Interacciones en modelos generalizados

Bibliografía anotada

Code exploratory

Simulations